AddN
对多个输入张量进行 逐元素相加,并将结果输出。 当前实现为二输入版本,可扩展用于多输入逐元素求和的场景。
数学表达式为:
\[dst_i = src0_i + src1_i\]
- 输入:
input0 - 第一个输入数据地址。
input1 - 第二个输入数据地址。
length - 计算长度(元素个数)。
core_mask - 核掩码(仅适用于共享存储版本)。
- 输出:
output - 计算结果地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持
fp32、fp64、int8、int16、int32、cplx64、cplx128类型MT7004 支持
fp16、fp32、int16、int32、cplx64类型所有输入与输出张量需具有相同的长度与数据布局
共享存储版本:
-
void fp_addn_s(float *input0, float *input1, float *output, int length, int core_mask)
-
void dp_addn_s(double *input0, double *input1, double *output, int length, int core_mask)
-
void i8_addn_s(int8_t *input0, int8_t *input1, int8_t *output, int length, int core_mask)
-
void i16_addn_s(int16_t *input0, int16_t *input1, int16_t *output, int length, int core_mask)
-
void i32_addn_s(int32_t *input0, int32_t *input1, int32_t *output, int length, int core_mask)
-
void c64_addn_s(cplx64 *input0, cplx64 *input1, cplx64 *output, int length, int core_mask)
-
void c128_addn_s(cplx128 *input0, cplx128 *input1, cplx128 *output, int length, int core_mask)
C调用示例:
1// FT78NE 示例
2#include <stdio.h>
3#include <addn.h>
4
5int main(int argc, char* argv[]) {
6 float *input0 = (float *)0xA0000000;
7 float *input1 = (float *)0xA0010000;
8 float *output = (float *)0xC0000000;
9
10 int length = 1024;
11 int core_mask = 0xff;
12
13 fp_addn_s(input0, input1, output, length, core_mask);
14 return 0;
15}
私有存储版本:
-
void fp_addn_p(float *input0, float *input1, float *output, int length)
-
void dp_addn_p(double *input0, double *input1, double *output, int length)
-
void i8_addn_p(int8_t *input0, int8_t *input1, int8_t *output, int length)
-
void i16_addn_p(int16_t *input0, int16_t *input1, int16_t *output, int length)
-
void i32_addn_p(int32_t *input0, int32_t *input1, int32_t *output, int length)
-
void c64_addn_p(cplx64 *input0, cplx64 *input1, cplx64 *output, int length)
-
void c128_addn_p(cplx128 *input0, cplx128 *input1, cplx128 *output, int length)
C调用示例:
1// FT78NE 示例
2#include <stdio.h>
3#include <addn.h>
4
5int main(int argc, char* argv[]) {
6 float *input0 = (float *)0x10810000; // L2 空间
7 float *input1 = (float *)0x10814000;
8 float *output = (float *)0x10820000;
9
10 int length = 1024;
11
12 fp_addn_p(input0, input1, output, length);
13 return 0;
14}